1
凸优化的几何基础
MATH008Lesson 8
00:00
想象你正在一个复杂的地形中穿行,目标是找到离安全区域最近的点。在优化语言中,这个“安全”区域是一个集合 $C$,而寻找最近点的行为称为 投影。虽然直觉认为总存在唯一的‘最近’点,但数学现实更为复杂。凸优化的几何基础在于对‘接近性’进行形式化,超越欧几里得直观,采用如指示函数和支撑函数等严格的函数表示。

1. 投影与距离

点 $x_0$ 到集合 $C$ 的距离定义为集合内所有点到该点距离的下确界:

$\text{dist}(x_0, C) = \inf\{\|x_0 - x\| \mid x \in C\}$

实现该最小距离的具体优化器即为投影算子:

$P_C(x_0) = \text{argmin}\{\|x - x_0\| \mid x \in C\}$

对于由 $a^T x = b$ 定义的简单超平面,投影具有优美的闭式解:$P_C(x_0) = x_0 + (b - a^T x_0)a/\|a\|_2^2$。然而,对于一般集合,这仍是一个约束优化问题: 最小化 $\|x - x_0\|$,约束条件为 $f_i(x) \leq 0$ 且 $Ax = b$

2. 函数几何

为了将几何约束视为目标函数的组成部分,我们采用两种强大的函数‘镜像’:

  • 指示函数 $I_C(x)$: $I_C(x) = \begin{cases} 0 & x \in C \\ +\infty & x \notin C \end{cases}$。它将几何结构转化为数值惩罚。
  • 支撑函数 $S_C(x)$: $S_C(x) = \sup_{y \in C} x^T y$。它通过每个方向上的边界超平面来刻画该集合。
定理:莫茨金定理

一个非空、闭合的集合 $C \in \mathbf{R}^n$ 是一个 切比雪夫集 (对每个 $x_0$ 都有唯一投影)当且仅当它是 凸的

证明概要(唯一性)

假设 $C$ 是凸集且范数是严格凸的。如果存在两个不同的最接近点 $u, v \in C$,使得 $\|u - x_0\| = \|v - x_0\| = d$,则它们的中点 $w = (u+v)/2$ 属于 $C$(由凸性保证)。

由范数的严格凸性可得:$\|w - x_0\| = \|\frac{1}{2}(u - x_0) + \frac{1}{2}(v - x_0)\| < \frac{1}{2}\|u - x_0\| + \frac{1}{2}\|v - x_0\| = d$。

这与 $d$ 是最小距离的假设矛盾。因此,投影必须是唯一的。

注意 8.4:范数依赖性

我们通常使用以下方式构造分离超平面:$(P_C(x_0) - x_0)^T (x - (1/2)(x_0 + P_C(x_0))) = 0$。请注意!这种特定构造仅在 欧几里得范数下成立下有效。一般范数需要对正交性进行更精细的处理。

🎯 核心洞察
凸性是确保几何优化稳定性的‘粘合剂’。没有它,即使是‘寻找最近点’这一简单任务也可能导致多个冲突的解,从而引发算法不稳定性。